Puma Katari & Big Data

700 mil datos analizando la calidad del servicio

rafael lopez v.

Octubre 2017





Objetivo: Evaluar y mejorar el servicio de los Puma Katari con datos generados por los propios buses






Sobre el proyecto

Se eligió 1 de las 6 rutas



Se eligió una dirección de la ruta



Se supuso que los GPS de los buses generan datos

Se tomaron los tiempos 5 veces (en condiciones normales)

Estas condiciones pueden alterarse por:

  • Paradas con mas gente que otras

  • Tramos mas lentos que otros: tráfico vehicular

  • Marchas y bloqueos en el centro de la ciudad

  • Horas que afectan los tiempos en los tramos (v.g. medio día vs. media noche)

  • Los intervalos de partida se extrajeron de aquí





Con todas estas características se simularon casi 700 mil datos en R





La simulación generó







Resultados


- 97% de los viajes tardan entre 52 y 60 minutos desde la primera hasta la última parada
- Sin embargo, a veces los buses tardan hasta 175 minutos (casi 3 horas)
- Veamos que días y a que horas se producen los mayores atrasos


- Los 4 picos muestran atrasos por protestas sociales
- Hay una tendencia en los picos pequeños: mayores atrasos alrededor de las 11 y 12 am y 8pm
- Pero.. en que tramos se producen los atrasos?


- Los tramos entre las paradas 1 y 4 son los menos regulares. Los atrasos se generan allí
- Veamos en detalle estos tramos, sabiendo que son los que generan los atrasos





Para ver el atraso por tramos y horas utilicé “boxplots”. Ver la siguiente explicación


- El tramo 1-2 sufre los mayores atrasos entre las 7 y 9 am, entre las 12 y 14 pm y 19-20 pm - El tramo 2-3 sufre los mayoes atrasos antre las 12 y 2 pm - El tramo 3-4 sufre los mayoes atrasos antre las 7 y 8 de la mañana - Veamos el mimso gráfico pero sin valores extremos





Ahora veamos los tiempos en los tramos no conflictivos

los mayores atrasos no se dan en estos tramos ##



Resumen hasta aquí





Los atrasos se dan por conflcitos sociales y también por demoras en horas picos en los tramos 1 al 4 (centro) particularmente

El objetivo es pasar del modelo azul al rojo: tiempo total del recorrido





Se sabe sobre que tramos y horas se debe actuar. Después, los datos nos dirán si las reformas son efectiuvas o no





Propuesta

No se necesita mucho



Los datos de la simulación pesan 14 megabytes o 2% de un DVD



Los datos para todas las rutas por año pesarían 19 gigabytes o 4 DVD`s

rafa lópez v